FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE4474, 493 aa
1>>>pF1KE4474 493 - 493 aa - 493 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.8755+/-0.00102; mu= 14.2315+/- 0.061
mean_var=64.8093+/-13.066, 0's: 0 Z-trim(103.3): 21 B-trim: 34 in 1/48
Lambda= 0.159315
statistics sampled from 7325 (7331) to 7325 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.597), E-opt: 0.2 (0.225), width: 16
Scan time: 3.050
The best scores are: opt bits E(32554)
CCDS5342.1 FSCN1 gene_id:6624|Hs108|chr7 ( 493) 3306 769.1 0
CCDS45811.1 FSCN2 gene_id:25794|Hs108|chr17 ( 492) 1914 449.1 4.9e-126
CCDS45810.1 FSCN2 gene_id:25794|Hs108|chr17 ( 516) 1539 363.0 4.5e-100
CCDS34746.1 FSCN3 gene_id:29999|Hs108|chr7 ( 498) 656 160.0 5.4e-39
>>CCDS5342.1 FSCN1 gene_id:6624|Hs108|chr7 (493 aa)
initn: 3306 init1: 3306 opt: 3306 Z-score: 4105.3 bits: 769.1 E(32554): 0
Smith-Waterman score: 3306; 100.0% identity (100.0% similar) in 493 aa overlap (1-493:1-493)
10 20 30 40 50 60
pF1KE4 MTANGTAEAVQIQFGLINCGNKYLTAEAFGFKVNASASSLKKKQIWTLEQPPDEAGSAAV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 MTANGTAEAVQIQFGLINCGNKYLTAEAFGFKVNASASSLKKKQIWTLEQPPDEAGSAAV
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE4 CLRSHLGRYLAADKDGNVTCEREVPGPDCRFLIVAHDDGRWSLQSEAHRRYFGGTEDRLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 CLRSHLGRYLAADKDGNVTCEREVPGPDCRFLIVAHDDGRWSLQSEAHRRYFGGTEDRLS
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE4 CFAQTVSPAEKWSVHIAMHPQVNIYSVTRKRYAHLSARPADEIAVDRDVPWGVDSLITLA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 CFAQTVSPAEKWSVHIAMHPQVNIYSVTRKRYAHLSARPADEIAVDRDVPWGVDSLITLA
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE4 FQDQRYSVQTADHRFLRHDGRLVARPEPATGYTLEFRSGKVAFRDCEGRYLAPSGPSGTL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 FQDQRYSVQTADHRFLRHDGRLVARPEPATGYTLEFRSGKVAFRDCEGRYLAPSGPSGTL
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE4 KAGKATKVGKDELFALEQSCAQVVLQAANERNVSTRQGMDLSANQDEETDQETFQLEIDR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 KAGKATKVGKDELFALEQSCAQVVLQAANERNVSTRQGMDLSANQDEETDQETFQLEIDR
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE4 DTKKCAFRTHTGKYWTLTATGGVQSTASSKNASCYFDIEWRDRRITLRASNGKFVTSKKN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 DTKKCAFRTHTGKYWTLTATGGVQSTASSKNASCYFDIEWRDRRITLRASNGKFVTSKKN
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE4 GQLAASVETAGDSELFLMKLINRPIIVFRGEHGFIGCRKVTGTLDANRSSYDVFQLEFND
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 GQLAASVETAGDSELFLMKLINRPIIVFRGEHGFIGCRKVTGTLDANRSSYDVFQLEFND
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE4 GAYNIKDSTGKYWTVGSDSAVTSSGDTPVDFFFEFCDYNKVAIKVGGRYLKGDHAGVLKA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 GAYNIKDSTGKYWTVGSDSAVTSSGDTPVDFFFEFCDYNKVAIKVGGRYLKGDHAGVLKA
430 440 450 460 470 480
490
pF1KE4 SAETVDPASLWEY
:::::::::::::
CCDS53 SAETVDPASLWEY
490
>>CCDS45811.1 FSCN2 gene_id:25794|Hs108|chr17 (492 aa)
initn: 1903 init1: 1170 opt: 1914 Z-score: 2376.2 bits: 449.1 E(32554): 4.9e-126
Smith-Waterman score: 1914; 56.2% identity (81.4% similar) in 495 aa overlap (1-493:1-492)
10 20 30 40 50 60
pF1KE4 MTANGTAEAVQIQFGLINCGNKYLTAEAFGFKVNASASSLKKKQIWTLEQPPDEAGSAAV
: .:: ....:::::.: ..:::::.::::::::: :::.:: :.:: :: . ..::
CCDS45 MPTNGLHQVLKIQFGLVNDTDRYLTAESFGFKVNASAPSLKRKQTWVLE--PDPGQGTAV
10 20 30 40 50
70 80 90 100 110
pF1KE4 CLRS-HLGRYLAADKDGNVTCEREVPGPDCRFLIVAHDDGRWSLQSEAHRRYFGGTEDRL
::: ::::::.:..:: :.:: : :: :::::.. . :::: :.:: : :.::::::.:
CCDS45 LLRSSHLGRYLSAEEDGRVACEAEQPGRDCRFLVLPQPDGRWVLRSEPHGRFFGGTEDQL
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE4 SCFAQTVSPAEKWSVHIAMHPQVNIYSVTRKRYAHLSARPADEIAVDRDVPWGVDSLITL
:::: .::::: :.::.:.:::... ::.:.::.:: : ::.:.: : :::::.:.::
CCDS45 SCFATAVSPAELWTVHLAIHPQAHLLSVSRRRYVHLCPRE-DEMAADGDKPWGVDALLTL
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE4 AFQDQRYSVQTADHRFLRHDGRLVARPEPATGYTLEFRSGKVAFRDCEGRYLAPSGPSGT
:...:: ... : :.:: ::::: .::: . :::::..::.::.::.:.:::: ::.::
CCDS45 IFRSRRYCLKSCDSRYLRSDGRLVWEPEPRACYTLEFKAGKLAFKDCDGHYLAPVGPAGT
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE4 LKAGKATKVGKDELFALEQSCAQVVLQAANERNVSTRQGMDLSANQDEETDQETFQLEID
::::. :. :::::: ::.: :::: :::.: ::.:::...:::::.: :.::: ..::
CCDS45 LKAGRNTRPGKDELFDLEESHPQVVLVAANHRYVSVRQGVNVSANQDDELDHETFLMQID
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE4 RDTKKCAFRTHTGKYWTLTATGGVQSTASSKNASCYFDIEWRDRRITLRASNGKFVTSKK
..::::.: . :: ::::.. ::...::.. .:. .:..::: ::..:.::::..: ::
CCDS45 QETKKCTFYSSTGGYWTLVTHGGIHATATQVSANTMFEMEWRGRRVALKASNGRYVCMKK
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE4 NGQLAASVETAGDSELFLMKLINRPIIVFRGEHGFIGCRKVTGTLDANRSSYDVFQLEFN
:::::: . .: .: : .:::::::.:.:: ::. .. .. ::.::: ::::.: :.
CCDS45 NGQLAAISDFVGKDEEFTLKLINRPILVLRGLDGFVCHHRGSNQLDTNRSVYDVFHLSFS
360 370 380 390 400 410
420 430 440 450 460 470
pF1KE4 DGAYNIKDSTGKYWTVGSDSAVTSSGDTPVDFFFEFCDYNKVAIKV-GGRYLKGDHAGVL
:::: :. : .: .:: ..: :.:. :: ::: . ...::.. .:.::.: .:.:
CCDS45 DGAYRIRGRDGGFWYTGSHGSVCSDGERAEDFVFEFRERGRLAIRARSGKYLRGGASGLL
420 430 440 450 460 470
480 490
pF1KE4 KASAETVDPASLWEY
.:.:.. ..::::
CCDS45 RADADAPAGTALWEY
480 490
>>CCDS45810.1 FSCN2 gene_id:25794|Hs108|chr17 (516 aa)
initn: 1415 init1: 870 opt: 1539 Z-score: 1910.1 bits: 363.0 E(32554): 4.5e-100
Smith-Waterman score: 1861; 53.6% identity (77.6% similar) in 519 aa overlap (1-493:1-516)
10 20 30 40 50 60
pF1KE4 MTANGTAEAVQIQFGLINCGNKYLTAEAFGFKVNASASSLKKKQIWTLEQPPDEAGSAAV
: .:: ....:::::.: ..:::::.::::::::: :::.:: :.:: :: . ..::
CCDS45 MPTNGLHQVLKIQFGLVNDTDRYLTAESFGFKVNASAPSLKRKQTWVLE--PDPGQGTAV
10 20 30 40 50
70 80 90 100 110
pF1KE4 CLRS-HLGRYLAADKDGNVTCEREVPGPDCRFLIVAHDDGRWSLQSEAHRRYFGGTEDRL
::: ::::::.:..:: :.:: : :: :::::.. . :::: :.:: : :.::::::.:
CCDS45 LLRSSHLGRYLSAEEDGRVACEAEQPGRDCRFLVLPQPDGRWVLRSEPHGRFFGGTEDQL
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE4 SCFAQTVSPAEKWSVHIAMHPQVNIYSVTRKRYAHLSARPADEIAVDRDVPWGVDSLITL
:::: .::::: :.::.:.:::... ::.:.::.:: : ::.:.: : :::::.:.::
CCDS45 SCFATAVSPAELWTVHLAIHPQAHLLSVSRRRYVHLCPRE-DEMAADGDKPWGVDALLTL
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE4 AFQDQRYSVQTADHRFLRHDGRLVARPEPATGYTLEFRSGKVAFRDCEGRYLAPSGPSGT
:...:: ... : :.:: ::::: .::: . :::::..::.::.::.:.:::: ::.::
CCDS45 IFRSRRYCLKSCDSRYLRSDGRLVWEPEPRACYTLEFKAGKLAFKDCDGHYLAPVGPAGT
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE4 LKAGKATKVGKDELFALEQSCAQVVLQAANERNVSTRQGMDLSANQDEETDQETFQLEID
::::. :. :::::: ::.: :::: :::.: ::.:::...:::::.: :.::: ..::
CCDS45 LKAGRNTRPGKDELFDLEESHPQVVLVAANHRYVSVRQGVNVSANQDDELDHETFLMQID
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE4 RDTKKCAFRTHTGKYWTLTATGGVQSTASSKNASCYFDIEWRDRRITLRASNGKFVTSKK
..::::.: . :: ::::.. ::...::.. .:. .:..::: ::..:.::::..: ::
CCDS45 QETKKCTFYSSTGGYWTLVTHGGIHATATQVSANTMFEMEWRGRRVALKASNGRYVCMKK
300 310 320 330 340 350
360 370 380 390
pF1KE4 NGQLAA------------------------SVETAGDSELFLMKLINRPIIVFRGEHGFI
:::::: .. : .: : .:::::::.:.:: ::.
CCDS45 NGQLAAISDFVGPPPRPAWTGKVAGGAAQQTLSPPGKDEEFTLKLINRPILVLRGLDGFV
360 370 380 390 400 410
400 410 420 430 440 450
pF1KE4 GCRKVTGTLDANRSSYDVFQLEFNDGAYNIKDSTGKYWTVGSDSAVTSSGDTPVDFFFEF
.. .. ::.::: ::::.: :.:::: :. : .: .:: ..: :.:. :: :::
CCDS45 CHHRGSNQLDTNRSVYDVFHLSFSDGAYRIRGRDGGFWYTGSHGSVCSDGERAEDFVFEF
420 430 440 450 460 470
460 470 480 490
pF1KE4 CDYNKVAIKV-GGRYLKGDHAGVLKASAETVDPASLWEY
. ...::.. .:.::.: .:.:.:.:.. ..::::
CCDS45 RERGRLAIRARSGKYLRGGASGLLRADADAPAGTALWEY
480 490 500 510
>>CCDS34746.1 FSCN3 gene_id:29999|Hs108|chr7 (498 aa)
initn: 319 init1: 224 opt: 656 Z-score: 813.5 bits: 160.0 E(32554): 5.4e-39
Smith-Waterman score: 656; 27.8% identity (57.8% similar) in 490 aa overlap (8-493:12-498)
10 20 30 40 50
pF1KE4 MTANGTAEAVQIQFGLINCGNKYLTAEAFGFKVNASASSLKKKQIWTLEQPPDEAG
.: ... :::. .. ::: :: :.:.:.:: ..: : . ..
CCDS34 MDETEWIHRHPKAEDLRVGLISWAGTYLTFEACKNTVTATAKSLGRRQTWEILVSNEHET
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE4 SAAVCLRSHLGRYLAADKDGNVTCEREVPGPDCRFLIVAHDDGRWSLQSEAHRRYFGGTE
.:.: :.: : :: . ::.: : . ::. : ...:.:: ::. ..
CCDS34 QAVVRLKSVQGLYLLCECDGTVCYGRPRTSHHGCFLLRFHRNSKWTLQCLISGRYLESNG
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE4 DRLSCFAQTVSPAEKWSVHIAMHPQVNIYSVTRKRYAHLSARPA-DEIAVDRDVPWGVDS
. : ....: . :. . :.: .: .:: .. ::. : :. .: :: :: .
CCDS34 KDVFCTSHVLSAYHMWTPRPALHVHVILYSPIHRCYAR--ADPTMGRIWVDAAVPCLEEC
130 140 150 160 170
180 190 200 210 220 230
pF1KE4 LITLAFQDQRYSVQTADHRFLRHDGRLVARPEPATGYTLEFRSGK-VAFRDCEGRYLAPS
. : :.: : ..:. :.:: : :: ..: :.. .. : : ::. : :: .: :.
CCDS34 GFLLHFRDGCYHLETSTHHFLSHVDRLFSQPSSQTAFHMQVRPGGLVALCDGEGGMLYPQ
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE4 GPSGTLKAGKATKVGKDELFALEQSCAQVVLQAANERNVSTRQGMDLSANQDEETDQETF
: : : : .: : :.. . : :.. . : .:. .. : ... . . :
CCDS34 GTHLLLGMGCNPMRG-EEWFILQHCPTWVSLRSKTGRFISVIYDGEVRAASERLNRMSLF
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE4 QLEIDRDTKKCAFRTHTGKYWTLTATGGVQSTASSKNASCYFDIEWRDRRITLRASNGKF
:.: : .. .:. .: : . .:.. . ... .: ..: :: :.. :.:
CCDS34 QFECDSESPTVQLRSANGYYLSQRRHRAVMADGHPLESDTFFRMHWNCGRIILQSCRGRF
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE4 VTSKKNGQLAASVETAGDSELFLMKLINRPIIVFRGEHGFIGCRKVTGTLDANRSSYD-V
. :. : :.: : .: : . . :: ..:.::..:..: . .. :... : .
CCDS34 LGIAPNSLLMANVILPGPNEEFGILFANRSFLVLRGRYGYVGSSSGHDLIQCNQDQPDRI
360 370 380 390 400 410
420 430 440 450 460 470
pF1KE4 FQLEFNDGAYNIKDSTGKYWTVGSDSAVTSSGDTPVDFFFEFCDYNKVAIKV-GGRYLKG
: : :... . :..:.. : .. : ..: .:. : ... . .: :...
CCDS34 HLLPCRPGIYHFQAQGGSFWSITSFGTFRPWGKFALNFCIELQGSNLLTVLAPNGFYMRA
420 430 440 450 460 470
480 490
pF1KE4 DHAGVLKASAETVDPASLWEY
:..:.: :..: . .::.
CCDS34 DQSGTLLADSEDITRECIWEF
480 490
493 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 09:16:21 2016 done: Sun Nov 6 09:16:22 2016
Total Scan time: 3.050 Total Display time: 0.030
Function used was FASTA [36.3.4 Apr, 2011]