FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KSDA0759, 670 aa
1>>>pF1KSDA0759 670 - 670 aa - 670 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.7274+/-0.000837; mu= 17.4383+/- 0.050
mean_var=75.5384+/-14.809, 0's: 0 Z-trim(107.9): 18 B-trim: 58 in 1/50
Lambda= 0.147567
statistics sampled from 9867 (9879) to 9867 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.677), E-opt: 0.2 (0.303), width: 16
Scan time: 3.180
The best scores are: opt bits E(32554)
CCDS9852.1 ANGEL1 gene_id:23357|Hs108|chr14 ( 670) 4669 1003.7 0
CCDS1512.1 ANGEL2 gene_id:90806|Hs108|chr1 ( 544) 1065 236.4 8.3e-62
CCDS73027.1 ANGEL2 gene_id:90806|Hs108|chr1 ( 375) 1044 231.8 1.3e-60
CCDS3743.1 NOCT gene_id:25819|Hs108|chr4 ( 431) 282 69.6 1e-11
>>CCDS9852.1 ANGEL1 gene_id:23357|Hs108|chr14 (670 aa)
initn: 4669 init1: 4669 opt: 4669 Z-score: 5368.4 bits: 1003.7 E(32554): 0
Smith-Waterman score: 4669; 100.0% identity (100.0% similar) in 670 aa overlap (1-670:1-670)
10 20 30 40 50 60
pF1KSD MIASCLCYLLLPATRLFRALSDAFFTCRKNVLLANSSSPQVEGDFAMAPRGPEQEECEGL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS98 MIASCLCYLLLPATRLFRALSDAFFTCRKNVLLANSSSPQVEGDFAMAPRGPEQEECEGL
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD LQQWREEGLSQVLSTASEGPLIDKGLAQSSLALLMDNPGEENAASEDRWSSRQLSDLRAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS98 LQQWREEGLSQVLSTASEGPLIDKGLAQSSLALLMDNPGEENAASEDRWSSRQLSDLRAA
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD ENLDEPFPEMLGEEPLLEVEGVEGSMWAAIPMQSEPQYADCAALPVGALATEQWEEDPAV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS98 ENLDEPFPEMLGEEPLLEVEGVEGSMWAAIPMQSEPQYADCAALPVGALATEQWEEDPAV
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD LAWSIAPEPVPQEEASIWPFEGLGQLQPPAVEIPYHEILWREWEDFSTQPDAQGLKAGDG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS98 LAWSIAPEPVPQEEASIWPFEGLGQLQPPAVEIPYHEILWREWEDFSTQPDAQGLKAGDG
190 200 210 220 230 240
250 260 270 280 290 300
pF1KSD PQFQFTLMSYNILAQDLMQQSSELYLHCHPDILNWNYRFVNLMQEFQHWDPDILCLQEVQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS98 PQFQFTLMSYNILAQDLMQQSSELYLHCHPDILNWNYRFVNLMQEFQHWDPDILCLQEVQ
250 260 270 280 290 300
310 320 330 340 350 360
pF1KSD EDHYWEQLEPSLRMMGFTCFYKRRTGCKTDGCAVCYKPTRFRLLCASPVEYFRPGLELLN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS98 EDHYWEQLEPSLRMMGFTCFYKRRTGCKTDGCAVCYKPTRFRLLCASPVEYFRPGLELLN
310 320 330 340 350 360
370 380 390 400 410 420
pF1KSD RDNVGLVLLLQPLVPEGLGQVSVAPLCVANTHILYNPRRGDVKLAQMAILLAEVDKVARL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS98 RDNVGLVLLLQPLVPEGLGQVSVAPLCVANTHILYNPRRGDVKLAQMAILLAEVDKVARL
370 380 390 400 410 420
430 440 450 460 470 480
pF1KSD SDGSHCPIILCGDLNSVPDSPLYNFIRDGELQYHGMPAWKVSGQEDFSHQLYQRKLQAPL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS98 SDGSHCPIILCGDLNSVPDSPLYNFIRDGELQYHGMPAWKVSGQEDFSHQLYQRKLQAPL
430 440 450 460 470 480
490 500 510 520 530 540
pF1KSD WPSSLGITDCCQYVTSCHPKRSERRKYGRDFLLRFRFCSIACQRPVGLVLMEGVTDTKPE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS98 WPSSLGITDCCQYVTSCHPKRSERRKYGRDFLLRFRFCSIACQRPVGLVLMEGVTDTKPE
490 500 510 520 530 540
550 560 570 580 590 600
pF1KSD RPAGWAESVLEEDASELEPAFSRTVGTIQHCLHLTSVYTHFLPQRGRPEVTTMPLGLGMT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS98 RPAGWAESVLEEDASELEPAFSRTVGTIQHCLHLTSVYTHFLPQRGRPEVTTMPLGLGMT
550 560 570 580 590 600
610 620 630 640 650 660
pF1KSD VDYIFFSAESCENGNRTDHRLYRDGTLKLLGRLSLLSEEILWAANGLPNPFCSSDHLCLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS98 VDYIFFSAESCENGNRTDHRLYRDGTLKLLGRLSLLSEEILWAANGLPNPFCSSDHLCLL
610 620 630 640 650 660
670
pF1KSD ASFGMEVTAP
::::::::::
CCDS98 ASFGMEVTAP
670
>>CCDS1512.1 ANGEL2 gene_id:90806|Hs108|chr1 (544 aa)
initn: 1364 init1: 577 opt: 1065 Z-score: 1223.1 bits: 236.4 E(32554): 8.3e-62
Smith-Waterman score: 1285; 44.4% identity (69.6% similar) in 471 aa overlap (207-667:119-544)
180 190 200 210 220 230
pF1KSD DPAVLAWSIAPEPVPQEEASIWPFEGLGQLQPPAVEIPYHEILWREWEDFSTQPDAQGLK
.: . . .. .. :.:: . .. .
CCDS15 QFQYCNWRPDNLSQTSLIHLSSYVMNAEGDEPSSKRRKHQGVIKRNWEYICSHDKEKTKI
90 100 110 120 130 140
240 250 260 270 280
pF1KSD AGD---GPQ-------FQFTLMSYNILAQDLMQQSSELYLHCHPDILNWNYRFVNLMQEF
:: :. :.:..::::::.:::....:.:: ::. .:.:..:: :...:.
CCDS15 LGDKNVDPKCEDSENKFDFSVMSYNILSQDLLEDNSHLYRHCRRPVLHWSFRFPNILKEI
150 160 170 180 190 200
290 300 310 320 330 340
pF1KSD QHWDPDILCLQEVQEDHYWEQLEPSLRMMGFTCFYKRRTGCKTDGCAVCYKPTRFRLLCA
.:.: :.::::::::::: ...:::. .:. : :: ::: : ::::.:.: ..: :: .
CCDS15 KHFDADVLCLQEVQEDHYGAEIRPSLESLGYHCEYKMRTGRKPDGCAICFKHSKFSLLSV
210 220 230 240 250 260
350 360 370 380 390 400
pF1KSD SPVEYFRPGLELLNRDNVGLVLLLQPLVPEGLGQVSVAPLCVANTHILYNPRRGDVKLAQ
.:::.::: . ::.:::::::::::: .: .. .::::::.::::::::.::.:
CCDS15 NPVEFFRPDISLLDRDNVGLVLLLQPKIP----YAACPAICVANTHLLYNPRRGDIKLTQ
270 280 290 300 310 320
410 420 430 440 450 460
pF1KSD MAILLAEVDKVARLSDGSHCPIILCGDLNSVPDSPLYNFIRDGELQYHGMPAWKVSGQED
.:.::::...::. .::: :::..:::.:::: ::::.::..:.:.:.:.: ::::::.
CCDS15 LAMLLAEISSVAHQKDGSFCPIVMCGDFNSVPGSPLYSFIKEGKLNYEGLPIGKVSGQEQ
330 340 350 360 370 380
470 480 490 500 510 520
pF1KSD FSHQLYQRKLQAPLWPSSLGITDCCQYVTSCHPKRSERRKYGRDFLLRFRFCSIACQRPV
:. :: :. :.:: .:::.. : : .. :: .: :.
CCDS15 SSRG--QRILSIPIWPPNLGISQNCVYEVQQVPK---VEKTDSDL---------------
390 400 410 420
530 540 550 560 570 580
pF1KSD GLVLMEGVTDTKPERPAGWAESVLEEDASELEPAFSRTVGTIQHCLHLTSVYTHFLPQRG
:.:. :.. .:. . . ...:: . :.:::.:..:. :
CCDS15 --------TQTQ-----------LKQ--TEVLVTAEKLSSNLQHHFSLSSVYSHYFPDTG
430 440 450 460
590 600 610 620 630 640
pF1KSD RPEVTTMPLGLGMTVDYIFFSAESCENGNRTDHRLYRDGTLKLLGRLSLLSEEILWAANG
::::: ..::::::.:::. . ... .. : ::::.:::::.:. ::..::
CCDS15 IPEVTTCHSRSAITVDYIFYSAEKEDVAGHPGAEVALVGGLKLLARLSLLTEQDLWTVNG
470 480 490 500 510 520
650 660 670
pF1KSD LPNPFCSSDHLCLLASFGMEVTAP
::: ::::: :::.: .:.
CCDS15 LPNENNSSDHLPLLAKFRLEL
530 540
>>CCDS73027.1 ANGEL2 gene_id:90806|Hs108|chr1 (375 aa)
initn: 1338 init1: 577 opt: 1044 Z-score: 1201.4 bits: 231.8 E(32554): 1.3e-60
Smith-Waterman score: 1256; 47.4% identity (71.9% similar) in 420 aa overlap (248-667:1-375)
220 230 240 250 260 270
pF1KSD ILWREWEDFSTQPDAQGLKAGDGPQFQFTLMSYNILAQDLMQQSSELYLHCHPDILNWNY
::::::.:::....:.:: ::. .:.:..
CCDS73 MSYNILSQDLLEDNSHLYRHCRRPVLHWSF
10 20 30
280 290 300 310 320 330
pF1KSD RFVNLMQEFQHWDPDILCLQEVQEDHYWEQLEPSLRMMGFTCFYKRRTGCKTDGCAVCYK
:: :...:..:.: :.::::::::::: ...:::. .:. : :: ::: : ::::.:.:
CCDS73 RFPNILKEIKHFDADVLCLQEVQEDHYGAEIRPSLESLGYHCEYKMRTGRKPDGCAICFK
40 50 60 70 80 90
340 350 360 370 380 390
pF1KSD PTRFRLLCASPVEYFRPGLELLNRDNVGLVLLLQPLVPEGLGQVSVAPLCVANTHILYNP
..: :: ..:::.::: . ::.:::::::::::: .: .. .::::::.::::
CCDS73 HSKFSLLSVNPVEFFRPDISLLDRDNVGLVLLLQPKIP----YAACPAICVANTHLLYNP
100 110 120 130 140
400 410 420 430 440 450
pF1KSD RRGDVKLAQMAILLAEVDKVARLSDGSHCPIILCGDLNSVPDSPLYNFIRDGELQYHGMP
::::.::.:.:.::::...::. .::: :::..:::.:::: ::::.::..:.:.:.:.:
CCDS73 RRGDIKLTQLAMLLAEISSVAHQKDGSFCPIVMCGDFNSVPGSPLYSFIKEGKLNYEGLP
150 160 170 180 190 200
460 470 480 490 500 510
pF1KSD AWKVSGQEDFSHQLYQRKLQAPLWPSSLGITDCCQYVTSCHPKRSERRKYGRDFLLRFRF
::::::. :. :: :. :.:: .:::.. : : .. :: .: :.
CCDS73 IGKVSGQEQSSRG--QRILSIPIWPPNLGISQNCVYEVQQVPKV---EKTDSDL------
210 220 230 240 250
520 530 540 550 560 570
pF1KSD CSIACQRPVGLVLMEGVTDTKPERPAGWAESVLEEDASELEPAFSRTVGTIQHCLHLTSV
:.:. .. .:. . . ...:: . :.::
CCDS73 -----------------TQTQLKQ-------------TEVLVTAEKLSSNLQHHFSLSSV
260 270 280
580 590 600 610 620 630
pF1KSD YTHFLPQRGRPEVTTMPLGLGMTVDYIFFSAESCENGNRTDHRLYRDGTLKLLGRLSLLS
:.:..:. : ::::: ..::::::.:::. . ... .. : ::::.:::::.
CCDS73 YSHYFPDTGIPEVTTCHSRSAITVDYIFYSAEKEDVAGHPGAEVALVGGLKLLARLSLLT
290 300 310 320 330 340
640 650 660 670
pF1KSD EEILWAANGLPNPFCSSDHLCLLASFGMEVTAP
:. ::..::::: ::::: :::.: .:.
CCDS73 EQDLWTVNGLPNENNSSDHLPLLAKFRLEL
350 360 370
>>CCDS3743.1 NOCT gene_id:25819|Hs108|chr4 (431 aa)
initn: 150 init1: 75 opt: 282 Z-score: 323.7 bits: 69.6 E(32554): 1e-11
Smith-Waterman score: 282; 28.7% identity (59.5% similar) in 237 aa overlap (247-472:145-361)
220 230 240 250 260 270
pF1KSD EILWREWEDFSTQPDAQGLKAGDGPQFQFTLMSYNILAQDLMQQSSELYLHCHPDILNWN
.:..::::: : .... ...: . :.:.
CCDS37 RAVLHTRPPRFQRDFVDLRTDCPSTHPPIRVMQWNILAQAL-GEGKDNFVQCPVEALKWE
120 130 140 150 160 170
280 290 300 310 320
pF1KSD YRFVNLMQEFQHWDPDILCLQEVQEDHYWEQLEPSLRMMGF--TCFYKRRTGC-------
: ...:. ..::::::::: :::.. ..: : .:. : : : . :
CCDS37 ERKCLILEEILAYQPDILCLQEV--DHYFDTFQPLLSRLGYQGTFFPKPWSPCLDVEHNN
180 190 200 210 220 230
330 340 350 360 370 380
pF1KSD KTDGCAVCYKPTRFRLLCASPVEYFRPGLELLNRDNVGLVLLLQPLVPEGLGQVSVAPLC
::::. . .::.:. .. . : :. ..:... :. :. : .:
CCDS37 GPDGCALFFLQNRFKLVNSANI---RLTAMTLKTNQVAIAQTLE--CKESGRQ-----FC
240 250 260 270 280
390 400 410 420 430 440
pF1KSD VANTHILYNPRRG--DVKLAQMAILLAEVDKVARLSDGSHCPIILCGDLNSVPDSPLYNF
.: ::. . : : . :: :: ..... ..:.. :.:.:::.:. : .:.
CCDS37 IAVTHL--KARTGWERFRSAQGCDLLQNLQNI---TQGAKIPLIVCGDFNAEPTEEVYKH
290 300 310 320 330
450 460 470 480 490 500
pF1KSD IRDGELQYHGMPAWKVSGQEDFSHQLYQRKLQAPLWPSSLGITDCCQYVTSCHPKRSERR
. .. :. .. :.:. . . :. :
CCDS37 FASSSLNLNS--AYKLLSADGQSEPPYTTWKIRTSGECRHTLDYIWYSKHALNVRSALDL
340 350 360 370 380 390
670 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 02:58:12 2016 done: Thu Nov 3 02:58:12 2016
Total Scan time: 3.180 Total Display time: 0.010
Function used was FASTA [36.3.4 Apr, 2011]